ISO/CEI 8859-15
ISO 8859-15 | |
Famille | ISO 8859 |
---|---|
Langues | allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes). |
Nombre de caractères | 96 |
État du projet | normalisé |
Plates-formes | Unix/Linux |
Organisme / Parrainage |
ISO/ Canada (Standards Council of Canada/Conseil canadien des normes), Danemark (Dansk
Standard), Finlande (SFS – STY/Tieke), France (AFNOR – Association française de normalisation), Irlande (NSAI – National Standards Authority of Ireland) |
Numéro d'enregistrement | 203 |
Séquences d'échappement | G1: ESC 02/13 06/02 G2: ESC 02/14 06/02 G3: ESC 02/15 06/02 |
Unité de codage (codet) | 7 à 8 bits |
Première version | 16 septembre 1998 |
Site web | http://www.itscj.ipsj.or.jp/ISO-IR/203.pdf |
modifier |
L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la 15e partie de la norme de codage de caractères ISO/CEI 8859 de l'Organisation internationale de normalisation (ISO).
Cette norme donne un code numérique tenant sur 8 bits aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).
Différences avec ISO/CEI 8859-1
[modifier | modifier le code]Le jeu de caractères ISO/CEI 8859-15 peut être considéré comme une mise à jour de la norme ISO/CEI 8859-1, avec laquelle il est identique à l'exception de huit caractères[1].
Position | 0xA4 | 0xA6 | 0xA8 | 0xB4 | 0xB8 | 0xBC | 0xBD | 0xBE |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | Š | š | Ž | ž | Œ | œ | Ÿ |
Note : les codes numériques sont donnés en base hexadécimale.
Le symbole de l’euro est devenu nécessaire dans la perspective de l’introduction imminente de la monnaie unique. Š, š, Ž et ž s’utilisent dans des mots d’emprunt et dans la translittération de noms russes en finnois et en estonien. Œ et œ sont des digrammes soudés français, et le Ÿ est nécessaire pour l’écriture tout-en-capitales des noms propres comme celui de la ville de l'Haÿ-les-Roses et celui du poète et écrivain Pierre Louÿs. Étant donné que les diacritiques sur les majuscules sont souvent (mais improprement[2],[3]) omis en français, on a cru pouvoir faire l’économie d’un point de code pour l’Ÿ dans ISO-8859-1, bien que sa minuscule ÿ y soit bien représentée (à 0xFF).
En revanche, quelques caractères peu utilisés ont été exclus.
Caractères supportés
[modifier | modifier le code]Le jeu de caractères complet est présenté dans le tableau ci-après.
ISO/CEI 8859-15 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | non utilisé | |||||||||||||||
1x | ||||||||||||||||
2x | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | non utilisé | |||||||||||||||
9x | ||||||||||||||||
Ax | ¡ | ¢ | £ | € | ¥ | Š | § | š | © | ª | « | ¬ | ® | ¯ | ||
Bx | ° | ± | ² | ³ | Ž | µ | ¶ | · | ž | ¹ | º | » | Œ | œ | Ÿ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Dans la table ci-dessus, 0x20 est l'espace standard, 0xA0 est l'espace insécable.
Les valeurs 0x00 à 0x1F, 0x7F, et 0x80 à 0x9F ne sont pas assignées à des caractères par l'ISO/CEI 8859-15.
Carte complète de l'ISO 8859-15 avec les différences par rapport à l'ISO/CEI 8859-1 marquées par un fond jaune :
ISO 8859-15 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
8x | PAD | HOP | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
9x | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | SGCI | SCI | CSI | ST | OSC | PM | APC |
Ax | NBSP | ¡ | ¢ | £ | € | ¥ | Š | § | š | © | ª | « | ¬ | ® | ¯ | |
Bx | ° | ± | ² | ³ | Ž | µ | ¶ | · | ž | ¹ | º | » | Œ | œ | Ÿ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Normalisation
[modifier | modifier le code]Le jeu de caractères ISO/CEI 8859-15 a été normalisé le 16 septembre 1998 sous le nom officiel de « Jeu supplémentaire latin pour l’Europe (« latin 9 ») », sous la direction et la plume d’Alain LaBonté[4]. Il définit 96 caractères graphiques.
Ce jeu de caractères est utilisable avec l’International Reference Version (IRV) de l’ISO/CEI 646 (ISO-IR 6) que ce soit dans un contexte 8 bits ou 7 bits, au travers de la technologie de l’ISO/CEI 2022. Il dérive du «latin no 1 (ISO-IR 100)» dont certains caractères ont été remplacés pour le français, le finnois, et le symbole Euro (€).
La normalisation du définit trois séquences d'échappement[5]:
- G1: ESC 02/13 06/02
- G2: ESC 02/14 06/02
- G3: ESC 02/15 06/02
En mode 8 bits, il est plus ou moins interopérable avec le windows-1252, dans la mesure où certains caractères sont affectés identiquement.
Usages et applications
[modifier | modifier le code]Avec l'arrivée de l'Euro, ce jeu s'est imposé en Europe comme le standard Unix/Linux, avant l'arrivée d'UTF-8. La plupart des logiciels fonctionnant avec des caractères mono-octets et ne dépendant pas d'un ordre spécifique des caractères ont pu continuer à fonctionner à l'identique.
Aujourd'hui, son usage s'efface au profit de l'UTF-8.
Aspects économiques et sociaux
[modifier | modifier le code]La norme a été sponsorisée par le Canada (Conseil canadien des normes), le Danemark (Dansk Standard), la Finlande (SFS – STY/Tieke), la France (Association française de normalisation), et l'Irlande (National Standards Authority of Ireland (en)).
La norme est disponible en langues française et anglaise[6].
La coexistence de normes de codages partiellement incompatibles conduit à la disparition du symbole euro de certains documents.
En informatique, il n’est pas exceptionnel de rencontrer un usage fautif du code 128 de Windows-1252 là où les normes stipulent que le codage Unicode ou ISO/CEI 8859-1 est utilisé. En particulier, en HTML et XML, l’entité numérique €
n’est pas valable ; le symbole euro doit être représenté avec l’entité numérique €
. En outre, dans un texte codé en ISO/CEI 8859-1 ou ISO 8859-15, le code 128 ne représente pas le symbole euro ; ISO 8859-1 ne permet pas de représenter le symbole euro et ISO 8859-15 utilise le code 164.
Notes et références
[modifier | modifier le code]- (en) « ISO-8859-15 », sur IANA (consulté le )
- « Accentuation des majuscules » [« Accenting of capitals »], Académie française (consulté le ) : « On veille donc, en bonne typographie, à utiliser systématiquement les capitales accentuées ... [One takes care then, in good typography, to use accented capitals systematically ...] »
- Lexique des règles typographiques en usage à l’Imprimerie nationale [« Lexicon of typographic rules in use at the National Printing Office »], Paris, Imprimerie nationale, , 8e éd., 196 p. (ISBN 978-2-7433-0482-9), p. 12
« On veillera à utiliser systématiquement les capitales accentuées, […] »
- Alain LaBonté, Norme internationale ISO/CEI�8859-15, typographie@inria.fr, thu, 15 apr 1999 14:22:42 -0400 (lire en ligne). (Voir dans CAN/CSA Z243.200#Historique.)
- http://www.itscj.ipsj.or.jp/ISO-IR/203.pdf
- (en) « ISO/IEC 8859-15 : 1999 », sur ISO (consulté le ).